Classification topologique probabiliste pour des données catégorielles
نویسندگان
چکیده
Cet article présente une carte auto-organisatrice probabiliste pour l’analyse et la classification topologique des données catégorielles. En considérant un modèle de mélanges parcimonieux nous introduisons une nouvelle carte auto-organisatrice (SOM) probabiliste. L’estimation des paramètres de notre modèle est réalisée à l’aide de l’algorithme EM classique. Contrairement à SOM, l’algorithme d’apprentissage proposé optimise une fonction objective. Ces performances ont été évaluées sur des données réelles et les résultats obtenus sont encourageants et prometteurs à la fois pour la classification et pour la modélisation.
منابع مشابه
Modèles de mélanges topologiques pour la classification de données catégorielles et mixtes
Résumé. Cet article présente une méthode basée sur les cartes auto-organisatrices probabilistes dédiées à la classification non supervisée et la visualisation de données catégorielles et des données mixtes contenant des composantes quantitatives et binaires. Pour chacun de ces types de données, nous proposons un formalisme probabiliste dans lequel les unités de la carte topologique sont représe...
متن کاملClassification relationnelle topographique
Résumé : Ce papier présente un formalisme relationnel pour la classification topographique de données qualitatives (ou catégorielles), se présentant sous forme d’une matrice binaire ou d’une somme de matrices binaires. L’algorithme de la classification relationnelle topographique proposé s’inspire du modèle de Kohonen (conservation de l’ordre topologique) et utilise le formalisme de l’Analyse R...
متن کاملClassification probabiliste non supervisée et visualisation des données séquentielles
Résumé. Nous proposons dans ce papier un nouvel algorithme de classification non supervisée à base de modèle de mélange topologique pour des données non i.i.d (non independently and identically distributed). Ce nouveau paradigme probabiliste, plonge les cartes topologiques probabilistes dans une formulation sous forme de chaînes de Markov cachées. Dans cette formulation, la génération d’une obs...
متن کاملClassification des données catégorielles via la maximisation spectrale de la modularité
Résumé. Ce papier présente un algorithme spectrale pour maximiser le critère de la modularité étendu à la classification des données catégorielles. Il met en evidence la connexion formelle entre la maximisation de la modularité et la classification spectrale, il présente en particulier le problème de maximisation de la modularité sous forme d’un problème algèbrique de maximisation de la trace. ...
متن کاملOptimisation des approximations de probabilité des requêtes en XML probabiliste
XML probabiliste est un modèle probabiliste pour les bases de données incertaines semi-structurées, avec des applications telles que l’intégration incertaine de données, l’extraction d’informations ou le contrôle probabiliste de versions. Nous explorons dans ce travail une solution efficace pour l’évaluation des requêtes tree-pattern avec jointures sur ces documents, ou, plus précisément, pour ...
متن کامل